智能论文笔记

Decoding Demographic un-fairness from Indian Names

Medidoddi Vahini , Jalend Bantupalli , Souvic Chakraborty , Animesh Mukherjee

分类：自然语言处理 | 机器学习

2022-09-07

人口统计学分类对于推荐系统的公平评估或测量在线网络和投票系统中的意外偏见至关重要。教育和政治等重要领域经常为社会平等的未来奠定基础，需要审查设计政策，这些政策可以更好地促进该国人口不平衡的人口分布限制的资源分配平等。我们收集三个公开可用的数据集，以培训性别和种姓分类领域的最先进的分类器。我们在印度背景下对模型进行训练，那里的同名可以拥有不同的造型惯例（一种州的Jolly Abraham/Kumar Abhishikta可以写为Abraham Jolly/Abishikta Kumar）。最后，我们还执行跨测试（在不同数据集上的培训和测试）以了解上述模型的功效。我们还对预测模型执行错误分析。最后，我们试图评估现有印度系统的偏见作为案例研究，并找到一些在性别和种姓层面的次大陆的复杂人口布局中表现出的有趣模式。

translated by 谷歌翻译